文本上的算法 深入淺出自然語言處理

文本上的算法 深入淺出自然語言處理

作者: 路彥雄
出版社: 人民郵電
出版在: 2018-02-01
ISBN-13: 9787115475879
ISBN-10: 7115475873
裝訂格式: 平裝
總頁數: 202 頁





內容描述


《文本上的算法 深入淺出自然語言處理》
結合-作者多年學習和從事自然語言處理相關工作的經驗,
力圖用生動形象的方式深入淺出地介紹自然語言處理的理論、方法和技術。
本書拋棄掉繁瑣的證明,提取出算法的核心,
幫助讀者盡快地掌握自然語言處理所必需的知識和技能。
本書主要分兩大部分。
第 一部分是理論篇,包含前3章內容,
主要介紹一些基礎的數學知識、*優化理論知識和一些機器學習的相關知識。
第 二部分是應用篇,包含第4章到第8章,分別針對計算性能、
文本處理的術語、相似度計算、搜索引擎、推薦系統、
自然語言處理和對話系統等主題展開介紹和討論。
本書適合從事自然語言處理相關研究和工作的讀者參考,
尤其適合想要瞭解和掌握機器學習或者自然語言處理技術的讀者閱讀。


目錄大綱


理論篇
第1章你必須知道的一些基礎知識………………………………………3 
1.1概率論………………………………………………… …………3 
1.2信息論……………………………………………………………4 
1.3貝葉斯法則…………………………………… …………………7 
1.4問題與思考………………………………………………………10 
第2章我們生活在一個尋求最優解的世界裡…… ………………………11 
2.1最優化問題………………………………………………………11 
2.2最大似然估計/最大後驗估計………… ………………………15 
2.3梯度下降法………………………………………………………17 
2.4問題與思考………………………… ……………………………22 
第3章讓機器可以像人一樣學習…………………………………………23 
3.1何謂機器學習…………… ………………………………………23 
3.2邏輯回歸/因子分解機…………………………………………29 
3.3最大熵模型/條件隨機場…… …………………………………34 
3.4主題模型…………………………………………………………40
3.5深度學習…………………………………………………………50 
3.6其他模型……………………………………………………… …88 
3.7問題與思考………………………………………………………97 
應用篇
第4章如何計算得更快……………………………… …………………101 
4.1程序優化………………………………………………………101 
4.2分佈式系統………………………………… …………………105 
4.3 Hadoop …………………………………………………………107 
4.4問題與思考………………………………… …………………114 
第5章你要知道的一些術語……………………………………………115 
5.1 tf/df/idf ……………………… …………………………………115 
5.2 IG/CHI/MI ………………………………………………………116 
5.3 PageRank ……………… …………………… ………………118 
5.4相似度計算……………………………………………………119 
5.5問題與思考…………………………………… ………………125
第6章搜索引擎是什麼玩意兒…………………………………………126 
6.1搜索引擎原理…………………………………………………126 
6.2搜索引擎架構…………………………………………………129 
6.3搜索引擎核心模塊……………………………………………130 
6.4搜索廣告………………………………………………………148 
6.5問題與思考……………………………………………………153 
第7章如何讓機器猜得更準……………………………………………155 
7.1基於協同過濾的推薦算法……………………………………156 
7.2基於內容的推薦算法…………………………………………158 
7.3混合推薦算法…………………………………………………159 
7.4問題與思考…… ………………………………………………163 
第8章理解語言有多難………………………………………… ……164 
8.1自然語言處理…………………………………………………164 
8.2對話系統…………………………………………………… …176 
8.3語言的特殊性…………………………………………………186
8.4問題與思考……………………………………………………190 
結語……………………………………………………………… …………191 
參考文獻……………………………………………………………………193


作者介紹


路彥雄
西安電子科技大學碩士畢業,
從事自然語言處理和機器學習相關工作多年,具有豐富經驗。
曾任微信小微機器人技術負責人,現任微信整合搜索算法組組長。




相關書籍

計算機視覺中的深度學習

作者 薑竹青 門愛東 王海嬰

2018-02-01

Python數據分析與應用

作者 黃紅梅 張良均

2018-02-01

Electronic Circuits with MATLAB, PSpice, and Smith Chart

作者 Won Y. Yang Jaekwon Kim Donghyun Paik Jingon Joung Sungjoon Lim Han L. Lee Woo June Choi Kyung W. Park Suhyun Park Taeho Im

2018-02-01